论文: Domino-Extracting,Comparing,and Manipulating Subsets across Multiple Tabular Datasets

作者: Samuel Gratzl, Nils Gehlenborg, Alexander Lex, Hanspeter Pfister and Marc Streit

发表会议:VAST2014 INFOVIS

导引:

介绍一种名为 Domino 的表数据的多形式可视化技术, 用于表示数据集的子集以及子集间的关系. 该技术给使用者提供了一套对子集进行排列组合和抽出的综合工具, 可以让用户实现常见的普通可视化形式以及针对特殊案例的高级可视化形式.

Domino 最核心的两个组成部分是块(blocks)和块关系(block relationship).

详解:

  1. 块有如下三种分类型, 数值型, 矩阵型. 分类型诸如性别分类:男 女两种. 数值型如 不同歌手唱片数量, 一个小矩形代表一个歌手. 矩阵型中, 两个 item type 可以一样可以不一样: 如果两个都是同样的城市名称, 那么就可以用此来表示距离矩阵; 不一样可以表示如不同病人的癌症基因表达. 排序: 数值型中是根据数据的值; 分类型中是根据不同 group 分类被赋予的值,group 内部无序的; 是根据两个维度 items 均值来, 按亮度顺序表示排序的高低.

    img

    块可以组合:

    img

  2. 块关系:

    如果子集包含相同种类的 items 则认为这些 blocks 是互相关联的.关系的度有四种 none, weak, medium, strong. 划分依据为下图中三个要素:是否共享项种类, 共享划分方式和共享排序方式. 对于 strong 的关系不需要显式的表示之, 故主要讨论 medium 和 weak 型关系的相关度.

    块关系

    块关系的表示方法: 两个方向, 三种粒度.

    两个方向: 平行与正交/ 三种粒度(粗到细): block, group 和 item 关系. 图中所示都符合一般可视化技术规范.

    关系的表示

  3. Domino 对子集的抽出和操纵的特点给人十分方便的体验. 它不仅可以在事先已经定义的集合上操作还可以即时

    用逻辑操作符(并、交、差)对现有子集进行组合, 或者基于选中的 items、groups 粒度从子集中抽出部分内容.

  4. Domino 支持许多种不同的可视化技术(可以说常见的都被其包含进去了)

    支持的技术

  5. 在其交互设计中有比较优秀的功能叫做实时预览 live preview 和占位符 placeholder. 操作模式也是有两个层次一个在块上, 一个在关系上, 还可以随意调节大小以及比例尺. 可以参看下面链接的视频. http://caleydo.org/projects/domino/(需要穿墙)

    案例:

    1. 第一个是音乐榜. 如下图, 得出来不少结论其实还是比较简单的不一定用这种技术才能看到的. 可能 live preview 对此有一定的帮助.

      musiccharts

    2. 第二个案例是胶质瘤癌症亚型分析. 依据癌症基因组图谱计划(TCGA)生成的恶性胶质瘤数据集(GBM), 利用 Domino 概括最近的 TCGA 对 GBM 研究成果. 在这个案例中, 利用强大的功能, 将多种表用不同的可视化技术结合起来, 通过简单的读图以及 live preview 功能发现其中各种潜在的关系. 其中有一种亚型有着特别不同的特性, 在抽出后又对改亚型的 mRNA 序列图进行进一步抽出特征, 进行比较得出可能的结论.

      cancer subtype analysis

讨论分析总结:

  1. 做的比较完备的, 融合了各种技术, 并且可以支持扩展. 由于这么一个完备的库在那, 可以定义为表数据可视化的一个 grammar.

  2. 在图形方面, 由于会做到基因序列一块, 对存储要求还是有点高的, 560×24000 这样的阵还是可以出色表现.

  3. 对于一些关系需要线和带(band)[也就是 weak 和 medium 关系], 会产生交叉. 需要用户自己去避免.

  4. 作者后面还会在以后的工作中还会强化 placeholder 的功能, 能及时为用户提供更精彩的潜在的有趣的关系来选择.

  5. 我个人看法的话, 作者这样算属于“集成创新”, 不能算彻底的创新但也不错.它将各种可能的形式都用进去, 可以从不同角度从很宽广的视角去看待联系发现联系.

  6. 文中给的两个案例第一个我觉得不能很好说明他的那种特性. 只能说明这种可视化技术的运用, 有些结论其实用别的技术也是很明显看的出来的, 就可能是关系的广度没有这么大; 第二个案例有比较专业的医学方面的术语有些难懂, 但是用这个 Domino 还是能看出一些端倪的, 具体怎样还需以后见解.

  7. 文中没有给出专家的评估以及其他用户感受的调研.



Questions & Discussion: ✉️ akiori@zju.edu.cn